Parada Óptima Continua mediante Aprendizaje por Refuerzo Profundo CARLOS: un nuevo algoritmo de RL en tiempo continuo que supera a los solvers Bermudas, acercándose al límite superior americano con alta eficiencia. 2026-06-17 · 3 min